Estimación de cambios en el número reproductivo efectivo \(R_t\)

  • Datos a partir de los reportes del Ministerio de Salud

El valor de \(R_t\) representa el número esperado de casos secundarios que surgen de un caso primario infectado en el momento \(t\). Este valor cambia a lo largo de un brote. Si el valor de \(R_t\) permanece por debajo de uno, el brote se extinguirá. Sin embargo, cuando \(R_t\) es mayor que uno, es probable que se produzca un brote sostenido. El objetivo de las intervenciones de control es típicamente reducir el número de reproducción por debajo de uno (Thompson et al. 2019).

Método de estimación aplicado (A. Cori et al. 2013; Thompson et al. 2019) permite la inclusión de los casos importados y que se puede estimar el intervalo serial a partir de seguimiento de casos y también incluir variablidad en la distribucion del intervalo serial cuando se asume una distribución gamma discreta.

  • Un parametro importante es el ‘Serial interval’ (SI). El SI es el tiempo entre el inicio de los síntomas de cada caso de la enfermedad en cuestión, y el inicio de los síntomas en cualquier caso secundario que resulte de la transmisión de los casos primarios. En otras palabras, es el tiempo entre casos en la cadena (de ramificación) de transmisión de la enfermedad. El SI es, de hecho, una distribución estadística de tiempos de intervalo en serie, en lugar de un valor fijo. Esa distribución se puede simular, generalmente utilizando una distribución gamma discreta con una media y desviación estándar dada.

  • Se utilizó un ‘Serial interval’ (SI) estimado por Q. Li et al. (2020) basado en 16 casos es de 7.5 días, con una SD=3.4, pero se permitió que la media del SI variara entre 2.3 y 8.4 usando una distribución normal truncada con una SD de 2.0, y tambien variamos la SD de la SD que variara entre 0.5 y 4.0

  • Luego se estimó el intervalo serial basandose en los datos de He et al. (2020) (77 casos), con una media estimada en su paper de 5.8 días, aunque esta dentro de los parámetros del punto anterior estos datos serían más realistas.

Variación en el intervalo serial

  • Usamos los datos de He et al. (2020) (77 casos) para estimar el intervalo serial (SI media de 5.8) y el \(R_t\), hay que eliminar el par con ID=9 porque el infector y el infectado suceden el mismo día. Estos datos consisten en la fecha de inicio de los síntomas en casos primarios y la fecha de inicio de síntomas en casos secundarios (originados por los primarios)

La mediana del intervalo serial estimado es mu =6.6944741 y la desviación sigma =4.4140809, lo cual es diferente de lo reportado en el paper de He et al. (2020) seguramente debido a que se usaron diferentes métodos. De ahora en adelante usaremos el intervalo serial estimado por nosotros.

Estimaciones usando modelos log-lineales

La fase inicial de un brote, cuando se muestra en un gráfico de semi-log (el eje y con una transformación logarítmica), aparece (algo) lineal. Esto sugiere que podemos modelar el crecimiento y decaimiento epidémico, utilizando un modelo log-lineal simple de la forma:

\[log(y) = rt + b\]

donde \(y\) es la incidencia, \(r\) es la tasa de crecimiento, \(t\) es el número de días desde un punto específico en el tiempo (generalmente el inicio del brote) y \(b\) es la ordenada de origen. Se ajustan modelos separados para distintas fases de la curva de epidemia (datos de incidencia).

  • Dividimos la curva de incidencia en dos partes, antes y despues del primer pico de incidencia que sucedió despues de la cuarentena (20/03/2020), que resultó el 30/03/2020. Tomamos esta fecha para determinar el \(R_0\) antes de la cuarentena

Estimamos con los casos locales (no importados) para toda Argentina

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.25 (95% CI 0.20 - 0.31)

  • La tasa de crecimiento después el pico fue 0.045 (95% CI 0.0474 - 0.043).

  • El tiempo de duplicacion de la primer parte es es 2.8 días (95% CI 2.3 - 3.5 días)

  • El tiempo de duplicación de la segunda parte 15.3 días (95% CI 14.6 - 16.1 días).

Proyecciones de incidencia para el total de casos Argentina

  • Esta estimación de proyecciones requiere la estimación del R0 para las dos fases que definimos (con division en el primer pico después de la cuarentena 2020-03-30), basado en (Nouvellet et al. 2018). Tomamos solamente los casos locales.

  • Utilizamos los datos sobre la incidencia diaria, el intervalo de serial (tiempo entre el inicio de los infectores y los infectados) y el número de reproductivo, que se mantiene constante, para simular trayectorias de epidemia plausibles y proyectar la incidencia futura. Se basa en un proceso de ramificación donde la incidencia diaria sigue un proceso de Poisson determinado por una infecciosidad diaria, calculada como:

\[\lambda_t \sim Pois \left ( \sum_{s=1}^{t-1} y_s w(t-s) \right ) \]

donde \(w()\) es la función de masa de probabilidad del intervalo serial, y \(y_s\) es la incidencia en el tiempo \(s\).

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.174   2.922   3.129   3.118   3.320   4.053

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.279   1.294   1.299   1.299   1.304   1.316

El \(R_0\) y la heterogeneidad de la epidemia

Habiendo hecho todos los calculos anteriores tenemos que aclarar que los análisis basados en el \(R_0\) (el número de reproducción básico, el número esperado de casos secundarios producida por un caso primario durante su período infeccioso en una población completamente susceptible (Kermack, McKendrick, and Walker 1927)) tienen una serie de susposiciones que no se cumplen (Hébert-Dufresne et al. 2020).Esto se puede razonar de la siguiente forma, el \(R_0\) nos dice el número de infecciones producidas por un caso pero ese numero promedio tiene una gran variación (Lloyd-Smith et al. 2005). Hay situaciones en las que se producen los eventos de super-propagación que están relacionadas con individuos que tienen mayor carga viral, o mayores contactos, o situaciones en las que se propicia la transmición (encuentros de muchas personas sin distancimiento ni protección). Es decir, puede ser engañoso mirar promedios provinciales o nacionales y celebrar si \(R_0\) parece estar cayendo por debajo de 1 porque la epidemia podría estar causando estragos en lugares deteminados o entre grupos particulares. Digamos que incluso si \(R_0\) está por debajo de 1 se pueden producir brotes grandes debido a la super-propagación o simplemente por casualidad.

Estimación de \(R_t\) y tiempo de duplicación para Ciudad de Buenos Aires CABA

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.14 (95% CI 0.10 - 0.18)

  • La tasa de crecimiento después el pico fue 0.046 (95% CI 0.0492 - 0.0433).

  • El tiempo de duplicación de la primer parte es es 5.0 días (95% CI 3.9 - 6.8 días)

  • El tiempo de duplicación de la segunda parte 15.0 días (95% CI 14.1 - 16.0 días).

Proyecciones de Incidencia para CABA

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.688   1.902   2.026   2.042   2.158   2.541

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.279   1.299   1.306   1.306   1.314   1.326

Estimación de \(R_t\) y tiempo de duplicación para Ciudad de Buenos Aires CABA a partir de Datos Abiertos

Número total de casos al 2020-07-13 = 39180

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.14 (95% CI 0.11 - 0.18)

  • La tasa de crecimiento después el pico fue 0.046 (95% CI 0.0495 - 0.0431).

  • El tiempo de duplicación de la primer parte es es 4.9 días (95% CI 4.0 - 6.3 días)

  • El tiempo de duplicación de la segunda parte 15.0 días (95% CI 14.0 - 16.1 días).

Estimación de \(R_t\) y tiempo de duplicación para Prov. de Buenos Aires

  • Utilizamos los reportes del Ministerio de Salud. La linea punteada marron vertical es el primer pico de casos local para separar la 1ra fase, de 2da fase. Las lineas rojas es el inicio de la quarentena y las fases del gobierno nacional.

  • Luego estimamos modelos log-lineales

  • La tasa de crecimiento antes del pico 2020-03-30 fue 0.15 (95% CI 0.093 - 0.21)

  • La tasa de crecimiento después el pico fue 0.049 (95% CI 0.0514 - 0.0468).

  • El tiempo de duplicación de la primer parte es es 4.6 días (95% CI 3.3 - 7.5 días)

  • El tiempo de duplicación de la segunda parte 14.1 días (95% CI 13.5 - 14.8 días).

Calculo de Proyecciones de Incidencia para Prov. De Buenos Aires

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.529   1.965   2.098   2.146   2.330   3.078

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.312   1.322   1.327   1.327   1.332   1.355

Estimación de \(R_t\) por provincia

  • Utilizamos los datos abiertos del Ministerio de Salud. Las lineas rojas son el inicio de la quarentena y las fases del gobierno nacional.

Chaco: Gran resistencia

fallecido fecha n porMillon
NO 2020-07-12 2177 5570
SI 2020-07-02 97 248

Comparación de datos de Incidencia (nro. de casos por día) por Provincia

  • Inicialmente utilizamos los datos abiertos del Ministerio de Salud. Las lineas rojas son el inicio de la quarentena y las fases del gobierno nacional.

  • Los datos cargados a partir de los reportes del Ministerio de Salud, tienen diferencias con los “Datos abiertos del Ministerio de Salud” en este último caso utilizamos las fechas de diagnóstico y la provincia de residencia, cuando lar provincia de residencia está SIN ESPECIFICAR se toma la provincia de carga.

residencia_provincia_nombre fecha Abiertos Reportes
Buenos Aires 2020-07-12 55460 53663
CABA 2020-07-12 39058 38333
Chaco 2020-07-12 2599 2577
Chubut 2020-07-12 211 206
Jujuy 2020-07-12 470 462
Neuquén 2020-07-12 727 693
Río Negro 2020-07-12 1101 1096

Parámetros a partir de Datos Abiertos por Provincia

  • Arreglo provicia de residencia SIN ESPECIFICAR asumiendo provincia de carga
  • Fallecidos sin fecha de hospitalización asumo que fueron hospitalizados.
  • Calculo de días de hospitalización solamente para los fallecidos.
  • Dias pre-hospitalización: desde inicio de síntomas hasta hospitalización.
Tabla 1: Fallecidos sin hospitalización con respecto a Casos, nro de días con respecto a inicio de síntomas
hospitalizado residencia_provincia_nombre edad dias_fallecimiento n Porcentaje
FALSE Buenos Aires 78.0 9.0 days 243 0.51
FALSE CABA 82.0 9.0 days 88 0.29
FALSE Río Negro 74.0 6.0 days 15 2.19
FALSE Córdoba 74.0 16.5 days 9 1.08
FALSE Chaco 70.5 7.0 days 8 0.34
FALSE La Rioja 80.0 9.0 days 5 3.85
FALSE Chubut 45.0 19.0 days 1 0.50
FALSE Neuquén 62.0 19.0 days 1 0.34
FALSE Tierra del Fuego 40.0 14.0 days 1 0.71
Tabla 2: TOTAL: Fallecidos sin fecha de hospitalización con respecto a Casos, nro de días con respecto a inicio de síntomas
fallecido edad dias_fallecimiento n Porcentaje
SI 78 9 days 371 0.44
Tabla 3: Proporcion Fallecidos con respecto a hospitalizados
residencia_provincia_nombre edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
Buenos Aires 73.0 7.0 days 2.0 days 691 8.19
CABA 76.5 9.0 days 2.0 days 622 6.87
Chaco 67.0 6.0 days 5.0 days 107 38.63
Río Negro 71.0 8.0 days 1.0 days 32 7.32
Córdoba 80.0 14.5 days 3.0 days 28 21.54
Neuquén 71.5 7.0 days 2.0 days 18 4.02
Mendoza 74.0 7.0 days 4.5 days 10 3.98
La Rioja 61.5 12.0 days 3.0 days 6 35.29
Santa Fe 67.0 13.0 days 2.5 days 6 7.69
Tucumán 63.5 9.0 days 3.0 days 5 20.83
Misiones 54.5 4.5 days 2.0 days 2 6.67
Salta 75.5 2.0 days 0.5 days 2 5.71
Chubut 86.0 0.0 days 2.0 days 1 10.00
Jujuy 52.0 16.0 days 6.0 days 1 33.33
Tierra del Fuego 79.0 23.0 days 1.0 days 1 14.29
Tabla 4: TOTAL: Proporcion Fallecidos con respecto a hospitalizados
fallecido edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 43 NA 2 days 17890 92.11
SI 74 8 days 2 days 1532 7.89
Tabla 5: Proporción Hospitalizados con respecto a casos
residencia_provincia_nombre edad n Porcentaje
CABA 45.0 9053 23.11
Buenos Aires 46.0 8441 15.17
Neuquén 36.0 448 60.54
Río Negro 41.0 437 38.91
Chaco 58.0 277 10.65
Mendoza 35.0 251 81.49
Entre Ríos 41.0 131 24.49
Córdoba 71.0 130 13.54
Santa Fe 63.0 78 14.50
Salta 40.0 35 30.43
Santa Cruz 50.0 31 46.97
Misiones 48.5 30 69.77
Tucumán 31.0 24 26.09
La Rioja 56.0 17 11.56
Chubut 64.0 10 4.74
San Luis 37.0 8 57.14
Tierra del Fuego 50.0 7 4.73
San Juan 44.0 5 55.56
Jujuy 42.0 3 0.64
Corrientes 64.0 2 1.56
Santiago del Estero 47.0 2 4.88
Formosa 61.0 1 1.28
La Pampa 71.0 1 14.29
Tabla 6: TOTAL Proporción Hospitalizados con respecto a casos
edad n Porcentaje
45 19422 18.81
Tabla 7: Letalidad Proporción Fallecidos con respecto a casos
residencia_provincia_nombre n Porcentaje
Buenos Aires 934 1.68
CABA 710 1.81
Chaco 115 4.42
Río Negro 47 4.19
Córdoba 37 3.85
Neuquén 19 2.57
La Rioja 11 7.48
Mendoza 10 3.25
Santa Fe 6 1.12
Tucumán 5 5.43
Chubut 2 0.95
Misiones 2 4.65
Salta 2 1.74
Tierra del Fuego 2 1.35
Jujuy 1 0.21
Tabla 8: TOTAL Letalidad Proporción Fallecidos con respecto a casos
fallecido n Porcentaje
SI 1903 1.84
Tabla 9: TOTAL: Proporcion Cuidado Intensivo con respecto a hospitalizados
cuidado_intensivo edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 43 8 days 2 days 17376 89.47
SI 64 9 days 3 days 2046 10.53
Tabla 10: TOTAL: De Hospitalizados cuantos Fallecen y fueron a Cuidado Intensivo, o no
fallecido cuidado_intensivo edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO NO 42 NA 2 days 16603 92.81
NO SI 59 NA 3 days 1287 7.19
SI NO 79 8 days 1 days 773 50.46
SI SI 69 9 days 3 days 759 49.54
Tabla 11: TOTAL: De Cuidado intensivo cuantos Fallecen
fallecido edad dias_hospitalizacion dias_pre_hospitalizacion n Porcentaje
NO 59 NA 3 days 1287 62.9
SI 69 9 days 3 days 759 37.1

Bibliografía

Cori, Anne, Neil M. Ferguson, Christophe Fraser, and Simon Cauchemez. 2013. “A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics.” American Journal of Epidemiology 178 (9): 1505–12. doi:10.1093/aje/kwt133.

He, Xi, Eric H. Y. Lau, Peng Wu, Xilong Deng, Jian Wang, Xinxin Hao, Yiu Chung Lau, et al. 2020. “Temporal Dynamics in Viral Shedding and Transmissibility of COVID-19.” Nature Medicine, April. Nature Publishing Group, 1–4. doi:10.1038/s41591-020-0869-5.

Hébert-Dufresne, Laurent, Benjamin M. Althouse, Samuel V. Scarpino, and Antoine Allard. 2020. “Beyond R0: Heterogeneity in Secondary Infections and Probabilistic Epidemic Forecasting,” April. http://arxiv.org/abs/2002.04004.

Kermack, William Ogilvy, A. G. McKendrick, and Gilbert Thomas Walker. 1927. “A Contribution to the Mathematical Theory of Epidemics.” Proceedings of the Royal Society of London. Series A, Containing Papers of a Mathematical and Physical Character 115 (772). Royal Society: 700–721. doi:10.1098/rspa.1927.0118.

Li, Qun, Xuhua Guan, Peng Wu, Xiaoye Wang, Lei Zhou, Yeqing Tong, Ruiqi Ren, et al. 2020. “Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus–Infected Pneumonia.” New England Journal of Medicine 382 (13). Massachusetts Medical Society: 1199–1207. doi:10.1056/NEJMoa2001316.

Lloyd-Smith, J. O., S. J. Schreiber, P. E. Kopp, and W. M. Getz. 2005. “Superspreading and the Effect of Individual Variation on Disease Emergence.” Nature 438 (7066, 7066). Nature Publishing Group: 355–59. doi:10.1038/nature04153.

Nouvellet, Pierre, Anne Cori, Tini Garske, Isobel M. Blake, Ilaria Dorigatti, Wes Hinsley, Thibaut Jombart, et al. 2018. “A Simple Approach to Measure Transmissibility and Forecast Incidence.” Epidemics 22 (March): 29–35. doi:10.1016/j.epidem.2017.02.012.

Thompson, R. N., J. E. Stockwin, R. D. van Gaalen, J. A. Polonsky, Z. N. Kamvar, P. A. Demarsh, E. Dahlqwist, et al. 2019. “Improved Inference of Time-Varying Reproduction Numbers During Infectious Disease Outbreaks.” Epidemics 29 (December): 100356. doi:10.1016/j.epidem.2019.100356.